Метод построения интерпретируемых скрытых марковских моделей для задачи поиска связываемых участков пептидов в последовательностях белков
Аннотация:
Введение. Решение задачи предсказания иммунного ответа организма на чужеродные фрагменты белковых последовательностей, обработанные клеткой, является ключевым этапом разработки персонализированных вакцин от рака. Отбор пептидов, участвующих в иммунном ответе, представляет собой сложный многоступенчатый процесс фильтрации исходных последовательностей для презентации их фрагментов на поверхности клетки. Наиболее изученной является задача предсказания одного из этапов такой фильтрации — вероятности связывания пептидов с молекулами главного комплекса гистосовместимости. Современные методы предсказания данного этапа обычно основаны на алгоритмах, использующих искусственные нейронные сети, что не позволяет в должной мере интерпретировать результаты работы моделей. Одним из методов решения проблемы является использование интерпретируемых скрытых марковских моделей. В работе выполнен анализ задачи предсказания связывающей способности и предложен метод построения интерпретируемых моделей, учитывающих ограничения и требования предметной области. Метод. Разработан метод построения, обучения и интерпретации скрытых марковских моделей для каждого класса молекул. Построение и обучение моделей основано на поддержании архитектуры модели, способной извлекать и визуализировать связываемый участок пептида. Интерпретация возможна благодаря анализу графа модели. Основные результаты. Предложенный метод протестирован в задаче обучения модели, позволяющей помимо предсказания получать позицию связываемого участка пептида и распределение аминокислот в нем. Обучены модели предсказания для двух разновидностей молекул с использованием данных связывания. Распределения аминокислот связываемого участка совпадают с распределениями состояний модели. Паттерны последовательностей участков, извлеченные с помощью обученных моделей для двух наборов пептидных данных, соответствуют паттернам из открытых источников, что подтверждает успешную апробацию метода. Обсуждение. Интерпретируемые модели лучше описывают предметную область задачи и помогают сделать выводы о характеристиках пептидов, основываясь на информации, извлеченной из модели. Эта информация позволит исследователям лучше понять остальные шаги процессинга пептидов при иммунном ответе: изучить взаимосвязи между ними и произвести перенос знаний из моделей, обученных для одного этапа, на другие. Таким образом, предлагаемый метод построения позволит обучать модели в условиях недостатка обучающих данных.
Ключевые слова:
Постоянный URL
Статьи в номере
- Разработка адаптивной лазерной головки для компенсации погрешности положения перетяжки пучка во время лазерной обработки с использованием метода обнаружения пятна лазерного излучения
- Исследование изменения чувствительности волоконной брэгговской решетки к температуре и растяжению с помощью нанесения покрытий из легкоплавких металлов
- Исследование влияния наведенного периодического механического напряжения на величину связи поляризационных мод в двулучепреломляющем оптическом волокне
- Метод поиска функции Ляпунова для анализа устойчивости нелинейных систем с использованием генетического алгоритма
- Робастная компенсация возмущений для многоканальных линейных систем с неизмеримым вектором состояния и запаздыванием в канале управления
- Управление отслеживанием траектории для мобильных роботов с адаптивным коэффициентом усиления
- Переключение электрических свойств тонкопленочных мемристивных элементов на основе GeTe последовательностями сверхкоротких лазерных импульсов
- Спектральные и кинетические характеристики свернутых в виде свитков ультратонких нанопластин селенида кадмия
- Метод оптимизации параметров установки камеры для видеоконтроля зоны наблюдения произвольной формы
- Использование антропометрических точек для внесения ограничений в синтез трехмерной модели тела человека с помощью SMPL
- Метод тестирования лингвистических моделей машинного обучения текстовыми состязательными примерами
- Новый эффективный адаптивный алгоритм шаблонного поиска для оценки движения
- Кластеризация в аналитике больших данных: системный обзор и сравнительный анализ (обзорная статья)
- Сегментация жестов слов на видео жестового языка
- Планирование заданий в распределенной вычислительной системе на кристалле с минимизацией потребляемой мощности
- Система маршрутизации клиентов на основе их эмоционального состояния и возраста в системах обслуживания населения
- Последствия малоподвижного поведения для здоровья и выявление неопределенных моделей поведения у взрослых
- Доверительные липшицевы классификаторы: инструмент гарантированной надежности
- Среда визуальной разработки программ многомерных нечетких интервально-логических регуляторов
- Решение задачи пространственного вращения 3D-поверхностей и их отображения на плоскости
- Аналитическое и имитационное моделирование гибких сочленений для мехатронных и робототехнических систем
- Оценка влияния степени заполнения реакционного тигля железо-олово на процессы тепло- и массопереноса в присутствии электрического тока высокой плотности
- Измерение показателя преломления с помощью автоколлимационного гониометра